智能论文笔记

Motion Planning for a Climbing Robot with Stochastic Grasps

Stephanie Newdick , Nitin Ongole , Tony G. Chen , Edward Schmerling , Mark R. Cutkosky , Marco Pavone

分类：机器人

2022-09-21

多限制攀岩机器人的运动计划必须考虑机器人的姿势，联合扭矩，以及它如何使用接触力与环境相互作用。本文着重于使用非传统运动来探索不可预测的环境（例如火星洞穴）的机器人运动计划。我们的机器人概念Reachbot使用可扩展和可伸缩的动臂作为四肢，在攀爬时实现了大型可伸缩度工作区。每个可扩展的动臂都由旨在抓住岩石表面的微生物抓地力封顶。 Reachbot利用其大型工作空间来绕过障碍物，裂缝和挑战地形。我们的计划方法必须具有多功能性，以适应可变的地形特征和鲁棒性，以减轻用刺抓握随机性质的风险。在本文中，我们引入了一种图形遍历算法，以根据适用于握把的可用地形特征选择一个离散的grasps序列。该离散的计划是由一个解耦运动计划者互补的，该计划者使用基于抽样的计划和顺序凸面编程的组合来考虑身体运动和最终效应器运动的交替阶段，以优化单个阶段。我们使用运动规划师在模拟的2D洞穴环境中计划轨迹，至少有95％的成功概率，并在基线轨迹上表现出改善的鲁棒性。最后，我们通过对2D平面原型进行实验来验证运动计划算法。

translated by 谷歌翻译

Automatic Crater Shape Retrieval using Unsupervised and Semi-Supervised Systems

Atal Tewari , Vikrant Jain , Nitin Khanna

分类：计算机视觉

2022-11-03

Impact craters are formed due to continuous impacts on the surface of planetary bodies. Most recent deep learning-based crater detection methods treat craters as circular shapes, and less attention is paid to extracting the exact shapes of craters. Extracting precise shapes of the craters can be helpful for many advanced analyses, such as crater formation. This paper proposes a combination of unsupervised non-deep learning and semi-supervised deep learning approach to accurately extract shapes of the craters and detect missing craters from the existing catalog. In unsupervised non-deep learning, we have proposed an adaptive rim extraction algorithm to extract craters' shapes. In this adaptive rim extraction algorithm, we utilized the elevation profiles of DEMs and applied morphological operation on DEM-derived slopes to extract craters' shapes. The extracted shapes of the craters are used in semi-supervised deep learning to get the locations, size, and refined shapes. Further, the extracted shapes of the craters are utilized to improve the estimate of the craters' diameter, depth, and other morphological factors. The craters' shape, estimated diameter, and depth with other morphological factors will be publicly available.

translated by 谷歌翻译

CLIP-FLow: Contrastive Learning by semi-supervised Iterative Pseudo labeling for Optical Flow Estimation

Zhiqi Zhang , Nitin Bansal , Changjiang Cai , Pan Ji , Qingan Yan , Xiangyu Xu , Yi Xu

分类：计算机视觉

2022-10-25

Synthetic datasets are often used to pretrain end-to-end optical flow networks, due to the lack of a large amount of labeled, real-scene data. But major drops in accuracy occur when moving from synthetic to real scenes. How do we better transfer the knowledge learned from synthetic to real domains? To this end, we propose CLIP-FLow, a semi-supervised iterative pseudo-labeling framework to transfer the pretraining knowledge to the target real domain. We leverage large-scale, unlabeled real data to facilitate transfer learning with the supervision of iteratively updated pseudo-ground truth labels, bridging the domain gap between the synthetic and the real. In addition, we propose a contrastive flow loss on reference features and the warped features by pseudo ground truth flows, to further boost the accurate matching and dampen the mismatching due to motion, occlusion, or noisy pseudo labels. We adopt RAFT as the backbone and obtain an F1-all error of 4.11%, i.e. a 19% error reduction from RAFT (5.10%) and ranking 2$^{nd}$ place at submission on the KITTI 2015 benchmark. Our framework can also be extended to other models, e.g. CRAFT, reducing the F1-all error from 4.79% to 4.66% on KITTI 2015 benchmark.

translated by 谷歌翻译

SmartMocap: Joint Estimation of Human and Camera Motion using Uncalibrated RGB Cameras

Nitin Saini , Chun-hao P. Huang , Michael J. Black , Aamir Ahmad

分类：计算机视觉

2022-09-28

来自多个RGB摄像机的无标记人类运动捕获（MOCAP）是一个广泛研究的问题。现有方法要么需要校准相机，要么相对于静态摄像头校准它们，该摄像头是MOCAP系统的参考框架。每个捕获会话都必须先验完成校准步骤，这是一个乏味的过程，并且每当有意或意外移动相机时，都需要重新校准。在本文中，我们提出了一种MOCAP方法，该方法使用了多个静态和移动的外部未校准的RGB摄像机。我们方法的关键组成部分如下。首先，由于相机和受试者可以自由移动，因此我们选择接地平面作为常见参考，以代表身体和相机运动，与代表摄像机坐标中身体的现有方法不同。其次，我们了解相对于接地平面的短人类运动序列（$ \ sim $ 1SEC）的概率分布，并利用它在摄像机和人类运动之间消除歧义。第三，我们将此分布用作一种新型的多阶段优化方法的运动，以适合SMPL人体模型，并且摄像机在图像上的人体关键点构成。最后，我们证明我们的方法可以在从航空摄像机到智能手机的各种数据集上使用。与使用静态摄像头的单眼人类MOCAP任务相比，它还提供了更准确的结果。我们的代码可在https://github.com/robot-ception-group/smartmocap上进行研究。

translated by 谷歌翻译

OysterNet: Enhanced Oyster Detection Using Simulation

Xiaomin Lin , Nitin J. Sanket , Nare Karapetyan , Yiannis Aloimonos

分类：计算机视觉

2022-09-16

牡蛎在海湾生活生态系统中起着关键作用，被认为是海洋的生命过滤器。近年来，牡蛎礁经过商业过度收获造成的重大破坏，需要保存以维持生态平衡。该保存的基础是估计需要准确的牡蛎检测的牡蛎密度。但是，用于准确的牡蛎检测系统需要大量数据集获得，这是水下环境中一项昂贵且劳动密集型的任务。为此，我们提出了一种新颖的方法，可以数学上对牡蛎进行建模并在模拟中渲染牡蛎的图像，以使用最小的真实数据来提高检测性能。利用我们的合成数据以及用于牡蛎检测的真实数据，与仅使用牡蛎网络仅使用真实数据相比，我们获得了高达35.1％的性能。我们还将最先进的工作提高了12.7％。这表明，使用对象的基本几何属性可以帮助成功提高有限数据集上的识别任务准确性，我们希望更多的研究人员对难以实现的数据集采用这种策略。

translated by 谷歌翻译

FUSION: Fully Unsupervised Test-Time Stain Adaptation via Fused Normalization Statistics

Nilanjan Chattopadhyay , Shiv Gehlot , Nitin Singhal

分类：计算机视觉 | 机器学习

2022-08-30

染色揭示了抽吸物的微结构，同时创建组织病理学幻灯片。染色变异被定义为源和目标之间的色差差异，是由于染色过程中的特征变化引起的，导致分布变化和目标的性能差。染色归一化的目的是将目标的色谱分布与源的色谱分布相匹配。然而，染色归一化会导致潜在的形态变形，从而导致错误的诊断。我们提出了Fusion，这是一种通过在无监督的测试时间方案中调整模型来促进污渍适应的新方法，从而消除了目标末端进行重大标记的必要性。 Fusion通过更改目标的批准统一统计数据，并使用加权因子将其与源统计融合在一起。根据加权因子，该算法减少到两个极端之一。尽管缺乏培训或监督，但融合超过了分类和密集预测（细分）的现有等效算法，如两个公共数据集上的全面实验所证明的那样。

translated by 谷歌翻译

HTML版本

Natural Backdoor Datasets

Emily Wenger , Roma Bhattacharjee , Arjun Nitin Bhagoji , Josephine Passananti , Emilio Andere , Haitao Zheng , Ben Y. Zhao

分类：计算机视觉

2022-06-21

有关后门毒物攻击的广泛文献研究了使用“数字触发图案”的后门攻击和防御措施。相比之下，“物理后门”使用物理对象作为触发器，直到最近才被确定，并且在质量上足够不同，可以抵抗针对数字触发后门的所有防御。对物理后门的研究受到了访问大型数据集的限制，该数据集包含包含与分类目标共同位置的物理对象的真实图像。构建这些数据集是时间和劳动力密集的。这项工作旨在应对有关物理后门攻击研究的可访问性挑战。我们假设在流行数据集（例如Imagenet）中可能存在天然存在的物理共同存在的对象。一旦确定，这些数据的仔细重新标记可以将它们转化为训练样本，以进行物理后门攻击。我们提出了一种方法，可以通过在现有数据集中识别这些潜在触发器的这些亚集，以及它们可能毒害的特定类别。我们称这些天然存在的触发级子集自然后门数据集。我们的技术成功地识别了广泛可用的数据集中的自然后门，并在行为上等同于在手动策划数据集中训练的模型。我们发布我们的代码，以使研究社区可以创建自己的数据集，以研究物理后门攻击。

translated by 谷歌翻译

Semantics-Depth-Symbiosis: Deeply Coupled Semi-Supervised Learning of Semantics and Depth

Nitin Bansal , Pan Ji , Junsong Yuan , Yi Xu

分类：计算机视觉

2022-06-21

多任务学习（MTL）范式着重于共同学习两个或多个任务，旨在重大改进W.R.T模型的通用性，性能和培训/推理记忆足迹。对于与视觉相关的{\ bf密集}的预测任务的联合培训，上述好处是必不可少的。在这项工作中，我们解决了两个密集任务的MTL问题，即\ ie，语义细分和深度估计，并提出了一个新颖的注意模块，称为跨通道注意模块（{CCAM}），可促进沿着每个频道之间的有效特征共享这两个任务，导致相互绩效增长，可训练的参数可忽略不计。然后，我们以一种真正的共生精神，使用称为{affinemix}的预测深度为语义分割任务制定新的数据增强，并使用称为{coloraug}的预测语义进行了简单的深度增强。最后，我们验证了CityScapes数据集上提出的方法的性能增益，这有助于我们基于深度和语义分割的半监督联合模型实现最新结果。

translated by 谷歌翻译

Understanding Robust Learning through the Lens of Representation Similarities

Christian Cianfarani , Arjun Nitin Bhagoji , Vikash Sehwag , Ben Zhao , Prateek Mittal

分类：机器学习 | 计算机视觉

2022-06-20

代表学习，即对下游应用有用的表示形式的产生，是一项基本重要性的任务，它是深层神经网络（DNNS）成功的基础。最近，对对抗性例子的鲁棒性已成为DNNS的理想特性，促进了解释对抗性例子的强大训练方法的发展。在本文中，我们旨在了解通过鲁棒培训所学的表示的特性与从标准的，非运动培训获得的培训的特性不同。这对于诊断稳健网络中的众多显着陷阱至关重要，例如，良性输入的性能降解，鲁棒性的概括不良以及过度拟合的增加。我们利用一组强大的工具在三个视觉数据集中被称为表示相似性指标，以获得具有不同体系结构，培训程序和对抗性约束的稳健和非稳健DNN之间的层次比较。我们的实验突出显示了迄今为止稳健表示的属性，我们认为，这是强大网络的行为差异的基础。我们发现在强大的网络的表示中缺乏专业化以及“块结构”的消失。我们还发现在强大的训练中过度拟合会在很大程度上影响更深的层。这些以及其他发现还为更好的健壮网络的设计和培训提出了前进的方向。

translated by 谷歌翻译

Can Backdoor Attacks Survive Time-Varying Models?

Huiying Li , Arjun Nitin Bhagoji , Ben Y. Zhao , Haitao Zheng

分类：计算机视觉 | 机器学习

2022-06-08

后门是针对深神经网络（DNN）的强大攻击。通过中毒训练数据，攻击者可以将隐藏的规则（后门）注入DNN，该规则仅在包含攻击特异性触发器的输入上激活。尽管现有工作已经研究了各种DNN模型的后门攻击，但它们仅考虑静态模型，这些模型在初始部署后保持不变。在本文中，我们研究了后门攻击对时变DNN模型更现实的情况的影响，其中定期更新模型权重以处理数据分布的漂移。具体而言，我们从经验上量化了后门针对模型更新的“生存能力”，并检查攻击参数，数据漂移行为和模型更新策略如何影响后门生存能力。我们的结果表明，即使攻击者会积极增加触发器的大小和毒药比，即使在几个模型更新中，一次射击后门攻击（即一次仅中毒训练数据）也无法幸免。为了保持模型更新影响，攻击者必须不断将损坏的数据引入培训管道。这些结果共同表明，当模型更新以学习新数据时，它们也将后门“忘记”为隐藏的恶意功能。旧培训数据之间的分配变化越大，后门被遗忘了。利用这些见解，我们应用了智能学习率调度程序，以进一步加速模型更新期间的后门遗忘，这阻止了单发后门在单个模型更新中幸存下来。

translated by 谷歌翻译